###############################################################################   
#### Replication Materials                                                 #### 
#### Kim, Nakka, Gopal, Desmrais, Mancinelli, Harden, Ko, Boehmke. 2021.   ####
#### Attention to the COVID-19 pandemic on Twitter:                        ####
#### Partisan differences among U.S. state legislators                     ####
#### Legislative Studies Quarterly                                         ####
###############################################################################  


###############################################################################
################################### Set Up ####################################
###############################################################################

# packages -------------------------

lapply(c('readr', 'tidyverse', 'DMwR2', 'sqldf', 'tidyr', 'dplyr', 'ggplot2', 
         'ggrepel', 'tm', '', 'knitr'), 
  require, 
  character.only = TRUE
  )

# read data (RDS) -------------------------

combo10k_dtm <- readRDS("combo10k_dtm.rds")


###############################################################################
###################### Generate FW Plots for Figure S1 ########################
###############################################################################

# specify labels -------------------------

final_label <- c(rep("Pandemic", 5000), rep("Non-Pandemic", 5000)) 

# run FW function -------------------------

source("fwgroups_function.r") # or run entire fwgroups_function.r script 

tenk_groups <- fwgroups(combo10k_dtm, 
                        groups = as.factor(final_label))

fwkeys.10k <- fw.keys(tenk_groups, 
                      n.keys = 20)

kable(fwkeys.10k)

as.data.frame(fwkeys.10k)

# create FW plot -------------------------

fw.10k <- fw.ggplot.groups(tenk_groups,sizescale = 4,
                           max.words = 100,
                           max.countrank = 400,
                           colorpalette=c("black","blue"))